Ссылка на каггл: https://www.kaggle.com/uciml/red-wine-quality-cortez-et-al-2009
%matplotlib inline
import os
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
import pandas_profiling
import seaborn as sns
import plotly.express as px
from sklearn.preprocessing import MinMaxScaler
from sklearn import preprocessing
df = pd.read_csv('winequality-red.csv')
df.shape
df.head(7)
df.info()
df.columns
features = ['fixed acidity', 'volatile acidity', 'citric acid', 'residual sugar',
'chlorides', 'free sulfur dioxide', 'total sulfur dioxide', 'density',
'pH', 'sulphates', 'alcohol']
target = ['quality']
По совету с лекции впервые использовала библиотку. Интресено, но не все понравилось (например, корреляция между переменными шлчит и не информативна как-то)
pandas_profiling.ProfileReport(df)